Universitatea "Politehnică" Bucureşti Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei Explorarea şi vizualizarea informaţiei din baze de imagini satelitare Proiect de diplomă prezentat ca cerinţă parţială pentru obţinerea titlului de Inginer în domeniul Calculatoare şi Tehnologia Informaţiei programul de studii de licenţă Ingineria Informaţiei Conducători ştinţifici Prof Dr Ing Mihai DATCU S l Dr Ing Daniela FAUR Absolvent Andreea GRIPARIS 2012 CUPRINS INTRODUCERE 8 Cap 1: TELEDETECŢIA 11 1 1 Radiaţia electromagnetică 11 1 2 Spectrul electromagnetic 12 1 3 Sateliţii 12 Cap 2: CARACTERISTICILE IMAGINILOR 16 2 1 Rezoluţia unei imagini 17 2 2 Caracteristicile imaginilor radar 19 2 3 Caracteristicile imaginilor optice 20 Cap 3: EXTRAGEREA TRĂSĂTURILOR SPECTRALE ŞI DE TEXTURĂ 23 3 1 Extragerea trăsăturilor spectrale 23 3 2 Extragerea trăsăturilor de textură 24 3 2 1 Metodele statistice 25 3 2 2 Metodele structurale 30 3 2 3 Metodele spectrale 30 Cap 4: VIZUALIZAREA DATELOR 32 4 1 Tipuri de date vizualizate 32 4 1 1 Datele unidimensionale 32 4 1 2 Datele bidimensionale 32 4 1 3 Datele multidimensionale 32 4 1 4 Text și Hipertext 32 4 1 5 Ierarhii și Grafuri 33 4 1 6 Aloritmi și Soft-uri 33 4 2 Tehnici de vizualizare 33 4 2 1 Tehnici bazate pe pixeli 33 4 2 2 Tehnici bazate pe proiecții geometrice 34 4 2 3 Tehnici bazate pe pictograme 35 4 2 4 Tehnici bazate pe ierarhii și grafuri 35 Cap 5: IMPLEMENTAREA ȘI VIZUALIZAREA CARACTERISTICILOR SPECTRALE ȘI DE TEXTURĂ 36 Cap 6: INTERFAȚA GRAFICĂ 45 CONCLUZII ȘI DIRECȚII VIITOARE 47 BIBLIOGRAFIE 48 Anexa 1 49 Anexa 2 50 Anexa 3 51 Anexa 4 52 Anexa 5 53 Anexa 6 54 LISTA FIGURILOR Figura 0 1: Vectorul de caracteristici rezultat pentru baza de imagini satelitare 9 Figura 0 2: Vectorul de caracteristici rezultat pentru baza de imagini multimedia 10 Figura 2 1: Spaţiul de reprezentare al unei imagin 14 Figura 2 2: Sistemul cartezian 14 Figura 2 3: Efectul sclipirii radar 17 Figura 2 4: Imagine satelitară ce conţine o stadion 18 Figura 2 5: Imagine satelitară ce conţine o pădure 18 Figura 2 6: Imagine satelitară ce surprinde un hotel pe marginea la unui lac 19 Figura 2 7: Imaginea satelitară a unui oraş 19 Figura 2 8: Imaginea satelitară a unei păduri 19 Figura 2 9: Imaginea satelitară a unui port 19 Figura 2 10: Clasificarea supervizată 20 Figura 2 11: Clasificarea nesupervizată 20 Figura 3 1: Imagine multimedia cu flori 22 Figura 3 2: Histograma imaginii din figura 3 1 22 Figura 3 3: Textură scorţoasă 22 Figura 3 4: Textură textil 22 Figura 3 5: Textură zid 22 Figura 3 6: Matricea unei imagini 23 Figura 3 7: Exemplificarea calculului matricei de coocurenţă a imaginii din figura 3 6 24 Figura 4 1: Vizualizarea cu coordonate paralele 33 Figura 5 1: Schema bloc a lucrării 35 Figura 5 2: Imaginile satelitare folosite pentru exemplificare 36 Figura 5 3: C 1-13 ale vectorului de trăsături pt img din fig 5 2 37 Figura 5 4: C 14-29 ale vectorului de trăsături pt img din fig 5 2 37 Figura 5 5: C 30-45 ale vectorului de trăsături pt img din fig 5 2 38 Figura 5 6: C 46-61 ale vectorului de trăsături pt img din fig 5 2 38 Figura 5 7: Vectorul de trăsături pt img din fig 5 2, reprezentat la nivel de pixel 38 Figura 5 8: Imaginile multimedia folosite pentru exemplificare 39 Figura 5 9: C 1-13 ale vectorului de trăsături pt img din fig 5 8 40 Figura 5 10: C 14-29 ale vectorului de trăsături pt img din fig 5 8 40 Figura 5 11: C 30-45 ale vectorului de trăsături pt img din fig 5 8 41 Figura 5 12: C 46-61 ale vectorului de trăsături pt img din fig 5 8 41 Figura 5 13: Vectorul de trăsături pt img din fig 5 8, reprezentat la nivel de pixel 41 Figura 6 1: Interfaţa grafică 43 Figura 6 2: Interfaţa în urma apăsării butonului de START şi de Textură 43 Figura 6 3: Finterfaţa după ce butonul G a fost apăsat şi o imagine, din listbox, a fost vizualizată 44 LISTA TABELELOR Tabelul 3 1: Caracteristicile de textură determinate pe baza histogramei 23 Tabelul 5 1: Primele 13 coloane ale vectorului de caracteristici pt img din fig 5 2 36 Tabelul 5 2: C 14-29 ale vectorului de caracteristici pt img din fig 5 2 36 Tabelul 5 3: C 30-45 ale vectorului de caracteristici pt img din fig 5 2 37 Tabelul 5 4: C 46-61 ale vectorului de caracteristici pt img din fig 5 2 37 Tabelul 5 5: Primele 13 coloane ale vectorului de caracteristici pt img din fig 5 8 39 Tabelul 5 6: C 14-29 ale vectorului de caracteristici pt img din fig 5 8 39 Tabelul 5 7: C 30-45 ale vectorului de caracteristici pt img din fig 5 8 40 Tabelul 5 8: C 46-61 ale vectorului de caracteristici pt img din fig 5 8 40 INTRODUCERE Tema proiectului „Explorarea și vizualizarea informației din baze de imagini satelitare” are în vedere progresul tehnologic al ultimilor ani în domeniul achiziţiei stocării imaginilor de teledetecţie Sistemele satelitare de observare a Terrei sunt o sursă importantă de informaţie, generând o cantitate semnificativă de date Această cantitate uriașă de date reprezintă o importantă resursă de informație, resursă ce nu poate fi folosită la adevăratul potențial din lipsa unor metode automate de extragere a informației relevante și utile din imagini Un utilizator experimentat are capacitatea de a explora și adnota imaginile însă acest lucru este posibil doar cu o parte extrem de mică din arhivele de imagini deja existente, astfel informația relevantă este foarte greu de găsit și devine nefolositoare O soluţie pentru această problemă este Exploarea Vizuală a Datelor Beneficiile acestei soluţii sunt datorate faptului că, implică în exploatarea datelor, atat cunoştiinţele omului cît şi puterea calculatorului Ideea de bază a explorării vizuale a datelor este prezentarea datelor într-o formă vizuală, permiţând omului să pătrundă în interiorul datelor, să tragă concluzii şi să interacţioneze cu datele Procesul de explorare vizuală a datelor poate fi văzut ca un proces generator de ipotez e Vizualizarea datelor permite utilizatorului să obţină o perspectivă din interorul datelor şi să vină cu o nouă ipoteză Verificarea ipotezei poate fi făcută atât prin exploare vizuală cât şi prin tehnicile automate de statistică sau algoritmi de învăţare În plus faţă de implicarea directă a omului, avantajele majore ale explorării vizua le a datelor sunt: - explorarea vizuală a datelor poate lucra uşor cu date neomogene şi zgomotoase; - explorarea vizuală a datelor este intuitivă şi nu necesită înţelegerea unor parametri sau a unor algoritmi matematici sau statistici complexi Lucrarea își propune să evalueze utilitatea caracteristilor spectrale (histograma pentru cele trei benzi RGB) și a celor de textură (caracteristicile Haralick) ale imaginilor în clasificarea bazelor mari de imagini Evaluarea a avut loc, în întregime, în programu l Matlab Pentru aceasta am lucrat cu două baze a câte 1000 de imagini fiecare O bază conține imagini multimedia, iar cea de a doua imagete satelitare, recuantizate pe 8 biți și de dimiensiunea 200 x 200 pixeli Imagetele sunt rezultate în urma divizării unei imagini achiziționate în zona orașului Hobart, Tasmania, Australia, cu senzorul GeoEye-1, geostereo Imaginea este multispectrală (4 benzi: albastru, verde, roșu, IR apropiat), pe 11 biți, are 2m rezoluție spațială și acoperă o suprafață de aproximativ 206 km2 Baza cu imagini multimedia era deja clasificată în 10 clase a câte 100 de imagini, astfel: oameni, litoral, monumente istorice, autocare, dinozauri, elefanți, flori, cai, peisaje montane și alimente Cea cu imagini satelitare a fost clasificată manual în 11 clase, în aproximat 600 de imagini din cele 1000 existente; regăsindu-se: img 0-99 pădure deasă, img 100-199 oraș, img 200-249 industrial, img 250-299 pădurere rară, img 300-359 nori, img 360-393 apă și uscat, img 394-411 teren de sport, img 412-438 deltă, img 439-490 drum/șosea, img 491-550 pământ și img 551-650 apă Pentru fiecare imagine au fost calculate atât caracteristicile spectrale (histograma pe cele trei benzi) cât și cele de textură (caracteristicile Haralick), aceste caracteristici fiind stocate într-un 8 vector astfel: liniile reprezintă imaginile iar coloanele caracteristicile (c1 -c13 caracteristicile Haralick, c14-c29 histograma pt R, c30-c45 histograma pt G, c46-c61 histograma pt B) Vectorul de caracteristici rezultat a fost reprezentat folosind două metode de vizualizare a bazelor mari de date: - tehnica cu coordonate paralele - reprezentarea la nivel de pixel Cele două metode de vizualizare a imaginilor au fost implementate într -o intefață grafică descrisă în capitolul 6 Un exemplu de vizualizare a conținutului de informație dintr -o bază mare de imagini este prezentat mai jos, pe axa orizontală fiind reprezentat numărul caracteristicii (1 -13 caracteristicile Haralick de textură, 14-29 histograma pentru banda de roșu, 30-45 histograma pt banda de verde, 46-61 histograma pentru banda de albastru), iar pe cea verticală, indexul imaginii Utilitatea unei astfel de interfețe constă în capacitatea de a identifica imaginile cu caracteristici similare Figura 0 1: Vectorul de caracteristici rezultat pentru baza de imagini satelitare 9 Figura 0 2: Vectorul de caracteristici rezultat pentru baza de imagini multimedia Structura lucrării Lucrarea este structurată în şase capitole În prima parte a lucrării sunt prezentate noțiunile folosite, după cum urmează: Primul capitol prezintă noțiuni legate de achiziția imaginilor de teledetecție, capitolul al doilea prezintă proprietățile și caracteristicile imaginilor, capitolul al treilea are în vedere trăsăturile spectrale și de textură folosite ca atribute pentru caracterizarea informațiilor din baza de imagini, cel de al patrulea capitol consideră tipurile de date ce pot fi vizualizate și modalități de vizualizare ale acestora În cea de a doua parte a lucrării este descris elementul de noutate și contribuția propriuzisă a autoarei În capitolul cinci sunt detaliate etapele utilizate pentru a calcula și vizualiza vectorul de caracteristici corespunzător unei anumite baze de imagini, iar în ultimul capitol, al şaselea, este explicată funcționarea interfeței grafice La sfârșitul acestei lucrări vor fi trecute concluziile lucrării și potențialele direcții viitoare de cercetare legate de tema abordată 10 Cap 1: TELEDETECŢIA Teledetecţia este ştiinţa de a obţine informaţii despre suprafaţa Pământului fără a fi propriu zis în contact cu aceasta, prin receptarea şi înr egistrarea energiei emise sau reflectate ca apo i această informaţie să fie procesată şi analizată Multe din procesele de teledetecţie implică interacţiunea dintre radiaţia incidentă şi obiectele de interes Procesul de teledetecție implică următoarele etape: 1 sursa de energie: iluminează sau produce energie electromagnetică obiectului de interes; 2 interacţiunea cu atmosfera: în timpul parcurgerii distanţei dintre sursă şi ţintă, energia întră în contact direct şi interacţionează cu atmosfera; 3 interacţiunea cu ţinta: când energia ajunge la ţintă, interacţionează cu aceasta Interacţiunea dintre energie şi ţintă depinde de proprietăţile celor două 4 înregistrarea energiei de către senzor: după ce energia e împrăştiată sau emisă de către ţintă, este necesar un senzor pentru a colecta şi înregistra radiaţia electromagnetică; 5 transmisia, recepţia şi procesarea: energia înregistrată de senzor trebuie să fie transmisă, deseori în format electronic, către o staţie de recepţie şi procesare, unde datele sunt procesate sub forma unei imagini; 6 interpretarea şi analiza: imaginea procesată este interpretată, vizual şi/sau digital sau electronic, pentru a extrage inforţiile despre ţinta iluminată; 7 aplicaţia: ultima etapă a procesului de teledetecţie este finalizată când se aplică informaţia extrasă pentru ilustrarea ţintei 1 1 Radiaţia electromagnetică Energia, produsă de sursă pentru a ilumina ţinta, este sub formă de radiaţie electr omagnetică Radiaţia electromagnetică constă dintr-un câmp electric care variază în amplitudine pe o direcţie perpendiculară pe direcţia de deplasare şi un câmp magnetic orientat perpendicular pe câmpul electric, ambele deplasându-se cu viteza luminii Pentru a înţelege teledecţia este necesară cunoaşterea a două caracteristici ale radiaţiei electromagetice şi anume: 1 lungimea de undă (λ ): - este lungimea unui ciclu de semnal; - poate fi măsurată ca distanţa dintre două creste succesive ale semnalului; - se măsoară în metri (m) sau submultipli (nm= m, µm= m, cm= m) ai acestuia 2 frecvenţa (v ): - reprezintă de câte ori semnalul trece printr-un anumit punct fix în unitatea de timp; - se măsoară în herţi (Hz) sau multipli ai acestuia (kHz= Hz, MHz= Kz), un herţ este echivalent cu un ciclu pe secundă 11 Legătura dintre cele două caracteristici este dată de relaţia: , unde c = viteza luminii în vid = m/s 1 2 Spectrul electromagnetic Spectrul electromagnetic cuprinde atat lungimi mici de undă, cum ar fi razele gamma şi X, cât şi lungimi mari, microundele şi undele radio Pentru teledecţie sunt utile doar anumite porţiuni din spectrul electromagnetic Acestea sunt: Porţiunea de violete (UV): are cele mai scurte lungimi de undă utilizate în teledetecţie Anumite materiale de pe Pământ, roci sau mirale, devin fluorescente sau emit lumină viz ibilă atunci când sunt iluminate de radiaţia ultravioletă Porţiunea vizibilă (0,4 - 0,7 µm ): Radiaţia luminoasă pe care ochiul uman o poate percepe este o parte a spectrului vizibil Albastru, verde şi roşu sunt culorile sau lungimile de undă primare ale spectrului vizibil Sunt denumite astfel deoarece nicio culoare nu poate fi produsă din amestecul altor două culori, dar toate celelalte culori pot fi formate din amestecul celor trei Deşi noi vedem lumina soarelui ca o culoare omogenă şi uniformă, este de fapt compusă din mai multe lungimi de undă ale radiaţiei, mai ales din porţiuni ale spectrului de violet, vizibil şi infraroşu Porţiunea de infraroşu (IR ) (0,7 - 100 µm): aceasta poate fi împărţită, conform proprietăţilor radiaţiei, în două părţi: Radiaţia IR reflectată (0,7 - 0,3μm ): folosită în teledetecţie similar cu cea din porţiunea vizibilă Radaţia IR emisă sau termală (0,3 - 100 μm): este chiar radiaţia emisă de suprafaţa Pământului sub formă de căldură Porţiunea de microunde (1 mm - 1 m): cea mai recent uilizată în teledetecţie şi cuprinde cele mai mari lungimi de undă utilizate de teledetecţie 1 3 Sateliţii Pentru ca un senzor să poată colecta şi înregistra energia reflectată de o ţintă sau suprafaţă, senzorul trebuie să stea pe o platformă stabilă în afara ţintei sau suprafeţei observate Platformele pentru senzori la distanţă pot fi situate pe teren, aeronave sau baloane (sau o altă platformă în interiorul atmosferei Pământului) sau pe nave spaţiale sau sateliţi în afara atmosferei Pământului Sateliţii sunt obiecte care se învârt în jurul unui alt obiect, în acest caz, Pământul Datorită orbitelor lor, sateliţii permit acoperirea repetată a suprafeţei Pământului pe o bază continuă Sateliţii au câteva caracteristici unice care îi fac foarte utili în teledetecţia suprafeţei Pământului Traiectoria urmată de un satelit poartă numele de orbită Orbitele sateliţilor sunt ad aptate capacităţii şi obiectivelor senzorilor transportaţi Selecţia orbitei poate varia în funcţie de altitudinea, orientarea şi rotirea relativă a acesteia faţă de Pământ 12 În funcţie de tipul orbitei sateliţii se clasifică în: Sateliţi cu orbite geostaţionare: Sateliţii cu o altitudine foarte mare (aproximativ 36 000 km), care observă mereu aceeaşi parte a suprafeţei Pământului au orbite geostaţionare Sateliţii geostaţionari se rotesc cu o viteză asemănătoare cu cea a Pământului astfel ei par staţionari în raport cu acea suprafaţă Acest lucru permite sateliţilor să observe şi să colecteze informaţii, în mod continuu, despre o suprafaţă anume Orbitele geostaţionare sunt întâlnite mai ales la sateliţii pentru comunicaţii şi vreme Sateliţi cu orbite aproximativ polare Multe platforme de teledetecţie sunt concepute pentru a urma o orbită (în principal nord -sud), care împreună cu rotaţia Pământului (vest -est), le permite să acopere cea mai mare suprafaţă a Pământului într-o anumită perioadă de timp Acestea sunt orbite aproximativ polare, au acest nume datorită înclinaţiei relative a orbitei faţă de linia dintre polul Sud şi Nord Sateliţi sincroni cu Soarele Sateţii sincroni cu Soarele sunt sateliţi cu orbită aproximativ polară Datorită sincronizării cu Soarele aceştia acoperă fiecare zonă a lumii la aceeaşi oră locală , numită ora locală a Soarelui La orice altitudine dată, poziţia Soarelui, când satelitul trece deasupra unei anumite zone, este aceeaşi în fiecare anotimp Acest lucru permite achiziţionarea imaginilor într-un anumit anotimp pe o periadă de câţiva ani succesivi sau a unei anumite zone pe parcusul multor zile consecutive, în aceleaşi condiţii de iluminare Acesta este un factor important pentru a monitoriza schimbările petrecute între imagini În funcţie de scopul lor, sateliţii se împart în: sateliţi meteo, sateliţi de observare a reliefului şi sateliţi de observare marină Sateliţi meteo Monitorizarea vremii şi prognoza a fost una dintre primele aplicaţii civile de teledetecţie satelitară, TIROS-1(Satelitul de Observare în Infraroşi şi Televiziune-1 "Television and Infrared OBSERVATION satellite- 1"), lansat de către SUA (Statele Unite ale Americii) în 1960 În următorii 5 ani au fost lansaţi mai mulţi sateliţi meteo, cu orbite aproximativ polare, generând acoperiri repetate ale modelelor meteorologice la nivel mondial În 1966, NASA (Administraţia Naţională a Statelor Unite a Spaţiului şi Aeronauticii "the US National Aeronautics and Space Administration") a lansat satelitul geostaţionar ATS-1 (Application Technology Satellite) care oferă, la fiecare jumătate de oră, imagini emisferice ale suprafeţei Pământului şi norilor Pentru prima dată, dezvoltarea şi circulaţia fenomenelor meteo au putut fi monitorizate Astăzi, mai mult e ţări studiază meteorologia sau sateliţii meteo pentru a monitoriza condiţiile meteorologic e de pe glob În general, aceşti sateliţi au o rezoluţie spaţială grosieră şi oferă o acoperire mare a suprafeţei Rezoluţia lor temporală este destul de mare, oferind frecvent observaţii despre suprafaţa Pământului, umiditatea atmosferică şi mişcarea norilor , ceea ce permite observarea aproape continuă a condiţiilor meteorologice globale şi, prin urmare, prognoza 13 Sateliţi de observare a reliefului Deşi mulţi dintre sateliţii meteo sunt şi pentru monitorizarea reliefului de pe Pământ, ei nu sunt optimizaţi pentru reprezentarea detaliată a suprafeţei terestre Primul satelit proiectat special pentru monitorizarea reliefului este Landsat-1 şi a fost lansat de NASA în 1972 Landsat a fost conceput ca un experiment care să testeze posibilitatea colectării observaţiilor terestre multispectrale pe o platformă satelitară fară pilot Din acel moment, ace st program de succes a adunat foarte multe date din întreaga lume cu ajutorul mai multor sateliţi Landsat Succesul programului Landsat se datorează mai multor factori, printre care: combinaţiei de senzori cu benzi spectrale adaptate obsevaţiilor terestre; rezoluţia spaţială funcţională; precum şi o bună acoperire a arealului Durata lungă de viaţă a programului a oferit o arhivă voluminoasă de date despre resurse terestre facilitând monitorizarea pe termen lung, înregistrările istorice şi cercetarea Toţi sateliţii Landsat sunt plasaţi pe orbite aproximativ polare şi sincrone cu Soarele Primii trei sateliţi (Landsat 1-3) erau la altitudini de aproximativ 900 km şi aveau perioada de revizitare de 18 zile, în timp ce sateliţii de mai târziu erau la 700 km şi aveau perioada de revizitare de 16 zile O serie de senzori au fost la bordul seriei de sateliţi Landsat, inclusiv sisteme de cameră Return Beam Vidicon (RBV), scanner-e multispectrale (MSS "MultiSpectral Scanner") şi Reprezentare Tematică (TM "Thematic Mapper") Cel mai popular sistem din primele zile a fost MSS, şi mai târziu TM Fiecare dintre aceşti senzori colectează date de pe o fâşie de 185 km, cu scenă definită pe 185km x 185km Sateliţi de observare marină Oceanele Pământului acoperă mai mult de două treimi din suprafaţa acestuia şi au un rol important în sistemul climatic global De asemenea, acestea conţin o varietate de organisme vii şi resurse naturale, care sunt sesibile la poluare şi alte riscuri indus e de om Atât sateliţii meteo cât şi cei pentru observarea reliefului pot fi utilizaţi pentru monitorizarea oceanelor, dar aceştia sunt alţi sateliţi/senzori care sunt proiectaţi special pentru acest scop Satelitul Nimbus-7, lansat în 1978, purta primul senzor, Scanner pentru Culoarea Zonei de Coastă (CZCS "Coastal Zone Colour Scanner"), destinat în mod special pentru monitorizarea apelor şi ocenelor terestre Obiectivul principal al acestui senzor a fost de a observa temperatura şi culoarea oceanelor, mai ales în zona de coastă, cu o rezoluţie spectrală şi spaţială suficientă pentru a detecta poluanţi în nivelul superior al oceanului şi pentru a determina natura materialelor aflate la suprafaţa apei Satelitul Nimbus a fost plasat pe o orbită aproximativ polară şi sincronă cu Soarele la altitudinea de 955 km Senzorul CZCS are şase benzi spectrale în vizibil, în IR apropiat şi porţiuni termice ale spectrului care colectează date la o rezoluţie spaţială de 825 m Primul satelit de observare marină se numea MOS-1 ("Marine Observation Satellite"), a fost lansat de Japonia în Februarie 1987 şi a fost urmat de succesorul său, MOS -2, în Februarie 1990 Sateliţi RADAR Conform descrierii din subcapitolul 1 2 (Spectrul electromagnetic), porţiunea de microunde acoperă cea mai mare parte a spectrului (1cm- 1m) Datorită lungimilor mari de undă, comparativ cu undele vizibile şi IR, microundele au proprietăţi speciale care su nt imporatante pentru teledetecţie Mai multe radiaţii cu microunde pot pătrunde prin nori, ceaţă, praf chiar şi prin precipitaţiilor abundente Lungimile de undă mai lungi, nu sunt predispuse la împrăştierea în atmosferă cum sunt lungimile de undă optice Această proprietate permite detecţia energiei 14 microundelor pe aproape orice condiţie meteo şi de mediu astfel că datele pot fi colectate oricând Senzorii pasivi de microunde sunt similari cu cei termici Toate obiectele emit energie microundă cu o anumită amplitudine, dar de obicei aceasta este foarte mică Un senzor pasiv de microunde detectează energia microundă emisă natural în domeniul său de observare Această energie emisă este legată de temperatura şi umiditatea obiectului sau suprafeţei emitent e Senzorii pasivi de microunde sunt de obicei radiometre sau scanner-e şi funcţionează aproximativ la fel ca sistemele descrise precedent execepţie făcând doar antena utilizată pentru a detecta energia microundă Senzorii activi de microunde au propria lo r sursă de microunde necesară iluminării ţintei În general, senzorii activi de microunde sunt împărţiţi în două categorii: imagistici şi non-imagistici Cel mai des întâlnit senzor imagistic este RADAR RADAR este acronimul pentru Radio Dection And Ranging, care, în esenţă, caracterizează funcţia şi operarea unui senzor radio Senzorul transmite un semnal de microunde (radio) ţintei şi detectează porţiunea de semnal întoarsă (reflectaă de ţintă) Puterea semnalului reflectat este măsurată pentru a determina diferenţa dintre ţinte diferite iar timpul de întârziere dintre semnalul transmis şi cel reflectat este măsurat pentru a determina distanţa dintre ţinte Senzorii non-imagistici includ altimetre şi scatterometre (dispozitive ce măsoară gradul de împrăştiere) În cele mai multe cazuri acestea sunt dispozitive ce utilizează o reprezentare unidimensională, spre deosebire de cele imagistice care utilizează o reprezentare bidimensională 15 Cap 2: CARACTERISTICILE IMAGINILOR Energia electromagnetică poate fi detectată fie fotografic fie electronic Procesul fotografic utilizează reacţii chimice pe suprafaţa filmului sensibil la lumină pentru a detecta şi înregistra variaţile de energie În teledetecţie este important să ştim diferenţa dintre termenii imagine şi fotografie O imagine se referă la orice poză, indiferent de lungimea de undă sau de dispozitivul de teledetecţie care a fost utilizat pentru a detecta şi înregistra energia electromagnetică Din punct de vedere matematic, o imagine poate fi definită ca o funcţie bidimensională f(x,y), unde x şi y sunt coordonatele spaţiale, iar amplitudinea lui f în orice pereche de coordonate (x,y) este numită intensitatea sau nivelul de gri, în acel punct, al imaginii O fotografie se referă în special la imaginea care a fost detectată şi înregistrată pe un film fotografic Deasemenea, o fotografie, poate fi reprezentată şi afişată în format digital prin subdivizarea imaginii în suprafeţe mici şi egale, numite pixeli şi reprezentând strălucirea fiecărei mici suprafeţe printr-o valoare numerică sau un număr digital În concluzie, imaginea digitală este o matrice compusă dintr -un număr finit de elemente (pixeli) Fiecare pixel este caracterizat de o locație (linia și coloana la care se găsește pixelul în matrice) și de o valoare (strălucirea relativă a acestuia) În cazul senzorilor care înregistrează electronic energia electromagnetică, aceasta este stocată de la bun început în format digital Pentru vizulizare, o imagine se afișează într-un sistem de coordonate diferit de cel cartezian Originea acestui sistem de coordonate este în colțul dn stânga sus iar coordonatele cresc de la stânga la dreapta și de sus în jos Coordonata x reprezintă linia iar coordonata y coloana (fig 2 1) Transformarea în sistemul cartezian plan (figura 2 2): xplan = y yplan = -x Figura 2 1: Spaţiul de reprezentare al unei imagini Figura 2 2: Sistemul cartezian 16 Există diferete criterii de clasificare ale imagilor, vor fi enumerate doar trei: În funcţie de tipul valorilor pixelilor, imaginile se clasifică în: a imagini scalare - fiecare valoare este un scalar;  imagini binare - pixelii pot avea doar două valori (0 şi 1) - pentru a reprezenta un pixel, utilizează doar un singur bit;  imagini alb-negru (cu nivele de gri) - valorea fiecărui pixel oferă doar informaţie despre intensitate b imagini vectoriale - fiecare componentă este un vector de numere  imagini color (vectorul are 3 componente);  imagini satelitare (vectori cu 3-200 componente);  imagini termografice (vectori cu 2-5 componente în banda de infraroşu) Imaginile se mai pot clasifica după semnificaţia ce se dă valorii numerice a pixelilor: a imagini de intensitate: valoarea fiecărui pixel este o măsură directă a intensităţii luminoase sau a mărimii fizice preluate de la senzor; b imagini indexate: valoarea fiecărui pixel este un indice ce face trimitere la poziţia din harta de culoare, asociată imaginii, în care se află informaţia de culoare O altă clasificare a imaginilor este după culoarea conţinută, şi anume: a imagini binare: au doar două valori posibile pentru pixeli; b imagini cu nivele de gri: valorile fiecărui pixel oferă informaţie doar despre intensitate; c imagini color: fiecare pixel conţine informaţie din trei canale şi este interpretat ca şi coordonate în acelaşi spaţiu de culoare; d imagini cu culori false: imaginea arată obiectul de interes în culori diferite de cele obţinute cu ajutorul unei fotografii; e imagini multi-spectrale: fiecare canal este sensibil la radiaţia dintr-o bandă îngustă de lungimi de undă, imaginea rezultată este o imagine multicanal ce conţine atât informaţii de luminozitate, cât şi informaţii spectrale (de culoare) Un exemplu de imagini multi-spectrale sunt cele satelitare 2 1 Rezoluţia unei imagini Rezoluţia spaţială Distingerea detaliilor vizibile într-o imagine depinde de rezoluţia spaţială a senzorului şi se referă la cea mai mică trăsătură care poate fi detectată Rezoluţia spaţială a senzorilor depinde în primul rând de câmpul instant aneu de vizualizare (IFOV- Instantaneous Field of View) Acesta este conul unghiular de vizibilitate al unui senzor ce determină pe suprafaţa Pământului aria care reprezintă imaginea de la o altitudine dată, într-un anume moment de timp Dimensiunea ariei văzute este determinată prin multiplicarea IFOV cu distanţa dintre pământ şi senzor Această zonă 17 de pe sol se numeşte celulă de rezoluţie şi determiză rezoluţia maximă a senzorului Pentru a fi detectată o caracteristică omogenă, dimensiunea acesteia trebuie să fie egală sau mai mare ca celula de rezoluţie De exemplu, dacă un senzor are rezoluţia spaţială 20m şi o imagine de la senzor este afişată la rezoluţie maximă, fiecare pixel reprezintă o suprafaţă de 20m x 20m de sol În acest caz dimensiunea pixelului este aceeaşi cu rezoluţia, dar este posibil să afişăm o imagine ce are dimensiunea pixelului diferită de rezoluţie Rezoluţia spectrală Abilitatea unui senzor de a distinge intervale fine de lungimi de undă este dată de rezoluţi a spectrală În cazul filmelor alb-negru rezoluţia spectrală este destul de aspră, astfel că multe lungimi de undă din spaţiul vizibil nu se pot diferenţia şi înregistrează reflexia pe întreaga porţiunie vizibilă Filmul color este, şi el, sensibil la energia reflectată în spectrul vizibil, dar are o rezoluţie spaţială mai mare, aşa cum recepţionează diferit energia reflectată pe lungimile de undă de albastru, roşu sau verde Multe sisteme de teledetecţie înregistrează energia pe game distincte de lungimi de undă la diferite rezoluţii spectrale Aceste sisteme se numesc senzori multispectrali Rezoluţia radiometrică În timp ce aranjarea pixelilor descrie structura spaţială a unei imagini, caracteristicile radiometrice descriu informaţiile reale existente într-o imagine De fiecare dată când o imagine este achiziţionată pe film sau de către un senzor, sensibilitatea sa la mărimea energiei electromagnetice determină rezoluţia radiometrică Rezoluţia radiometrică a unui sistem de vizualizare reprezintă capacitatea sa de a deosebi cele mai neînsemnate diferenţe Cu cât este mai fină rezoluţia radiometrică a unui senzor cu atât este mai sensibil în detectarea celor mai mici diferenţe în energia reflectată sau emisă Datele imaginii sunt reprezentate prin numere digitale pozitive care variază între 0 şi o putere a lui 2 Acest interval corespunde numărului de biţi utilizaţi pentru a coda numerele în format binar Fiecare bit înregistrează un exponent al puterii lui 2 (ex: 1 bit = ) Numărul maxim de niveluri de strălucire depinde de numărul de biţi utilizaţi în reprezentarea energiei înregistrate Astfel, în cazul în care se utilizează 8 biţi pentru înregistrarea datelor, ar fi disponibile valori digitale, cuprinse între 0 şi 255 Rezoluţia temporală Perioada de revizitare se referă la durata de timp necesară unui satelit sa parcurgă întreaga orbită De obicei perioada de revizitare a unui senzor este de mai multe zile Prin urmare, rezoluţia temporală absolută a unui sistem de teledetecţie este egală cu perioada de timp necesară acestuia să observe a două oară o aceeaşi suprafaţă terestră, din acelaşi unghi Rezoluţia temporală efectivă a unui senzor depinde de mai mulţi factori, inclusiv de capacităţile sateliţilor/senzorilor, fâşiile suprapuse ş i latitudine 18 2 2 Caracteristicile imaginilor radar Spre deosebire de celelalte imagini, cele radar au proprietăţi particulare, cum ar fi: sclipirea, distorsiunea datorată gradului de înclinare, modelul antenă şi gama dinamică Sclipirea Toate imaginile radar au un anumit grad de sclipire, pe care noi o numim sclipire radar Sclipirea apare, în imagine, ca o textură de tip sare şi piper Acest lucru este cauzat de interferenţa distructivă şi constructivă aleatoare a întoarcerii multiplelor împrăştieri care au loc în fiecare celulă de rezoluţie Ca de exemplu,(figura 1 1), o ţintă omogenă, cum ar fi iarba care acoperă terenul, fără efectul de sclipire, în general, ar fi reprezentată prin valori ale tonurilor de lumină ca în careul A Cu toate acestea, reflexiile firelor de iarbă din fiecare celulă de rezoluţie determină pixeli cu valori destul de diferite, ca în careul B De fapt, sclipirea este o formă de zgomot impulsiv, care degradează calitatea imagini şi poate face interpretarea acesteia mai dificilă Din această cauză este de dorit ca sclipirea să fie eliminată înainte de analiza şi interpretarea imaginii Reducerea sclipirii se poate face prin filtrarea spaţală Figura 2 3: Efectul scilipirii radar Distorsiunea datorată gradului de înclinare În urma comprimării caracteristicile cu valori apropiate sunt reprezentate drept caracteristici cu valori depărtate ceea ce duce la apariţia erorilor Modelul antenă O antenă radar transmite mai multă putere în mijlocul culuarului de iluminat decât la extremităţi Acest efect este cunoscut sub numele de model antenă şi are ca efect reflexii mai putenice în centrul culoarului decât în margini Corecţia modelului antenă poate fi făcută prin producerea unei luminozităţi medii, uniforme de-a lungul culoarului, astfel imaginea poate fi interpretată vizual mai bine Gama dinamică Gama nivelurilor de luminozitate care pot fi diferenţiate de sistemul de teledetecţie este determinată de rezoluţia radiometrică şi poartă denumirea de gamă dinamică În timp ce senzorii optici, ca cei utilizaţi de sateliţii Landsat, pot reproduce 256 de niveluri de intensitate, sistemele radar pot reproduce aproximativ 100 000 de nivele Deoarece och iul uman nu poate percepe atâtea nivele de intensitate, sateliţii radio înregistrează şi procesează datele originale cu 16 biţi (65 536) 19 2 3 Caracteristicile imaginilor optice Analiza imaginilor de teledetecţie implică identificarea mai multor ţinte în imagine, acestea pot fi caracteristici de mediu sau artificiale care constau din puncte, linii sau zone Ţintele pot fi definite în funcţie de modul în care acestea reflectă sau emit radiaţii Aceste radiaţii sunt măsurate şi înregistrate de către un senzo r, iar la final sunt reprezentate ca o imagine Recunoşterea ţintelor este cheia interpretării şi extragerii informaţiilor Observarea diferenţelor dintre ţinte şi fundalul acestora implică compararea diferitelor ţinte în raport, cu unul sau mai multe, elemente vizuale cum ar fi tonul, forma, dimensiunea, modelul, textura, umbra sau asocierea Tonul se referă la luminozitatea relativă sau culoarea obiectelor dintr -o imagine În general, tonul este elementul fundamental ce face deosebirea dintre diferit e ţinte sau caracteristici Deasemenea, variaţile tonului permit distingerea elementelor ca forma, textura sau tipologia obiectelor În general forma se referă la forma, structura sau schiţa unui obiect individual Forma poate fi un indiciu foarte distinct iv pentru interpretare Forme cu margini drepte, de obicei, reprezintă mediul urban sau câmpuri agricole, în timp ce forme cu margini neregulate pot reprezenta păduri (fig 2 5), lacuri Terenurile agricole sau culturile irigate prin sistem de rotire pot apărea ca forme circulare Tot cu ajutorul formei se pot diferenţia elementele unui stadion, de exemplu terenul de fotbal are o formă dreptunghiulară, în timp ce pistele de atletism şi tribunele au o formă ovală (fig 2 4) Figura 2 4: Imagine satelitară ce conţine un stadion Figura 2 5: Imagine satelitară ce conţine o pădure Dimensiunea obiectelor din imagine este în funcţie de scara utilizată Pentru o interpreatare mai bună a unui obiectiv este important să se evalueze dimensiunea acestuia în raport cu alte obiecte dintr-o scenă, precum şi mărimea absolută O aproximare rapidă a dimensiunii poate duce mult mai repede la o interpretare adecvată (figura 2 6) Modelul se referă la dispunerea spaţială a obiectelor ce pot fi identificate vizibil De obicei, o repetare ordonată de tonuri şi texturi similare va produce, în cele din urmă, recunoaşterea un ui model distinctiv (figura 2 7) 20 Figura 2 6: Imagine satelitară ce surprinde un hotel pe marginea unui lac Figura 2 7: Imagine satelitară a unui oraş Textura se referă la aranjarea şi frecvenţa tonurilor într -o anumită zonă a imaginii Texturile aspre constau din pete de culoare care îşi schimbă brusc culoarea într -o mică zonă, în timp ce texturile fine au o variaţie foarte mică a tonurilor Texturile netede sunt rezultatul unor zone uniforme cum ar fi asfaltul sau păşunile Textura este unul dintre cele mai importante elemente caracteristice în distingirea imaginilor (figura 2 8) Umbra este, şi ea, utilă în interpretare, deoarece poate oferi o idee despre profilul şi înălţimea relativă a unuia sau mai multor obiecte Cu toate acestea, umbrele, pot reduce sau elimina interpretarea în zona lor de influenţă, deoarece obiectele umbrite sunt mai puţin perceptibile Umbra este utilă mai ales în cazul imaginilor radar datorită faptului că îmbunătăţeşte şi identifică topologia şi forma de relief Asocierea ia în considerare relaţia dintre caracteristicile sau obiectele uşor de recunoscut din apropierea obiectului de interes Identificarea trăsăturilor pe care cineva se aşteaptă să le asocieze cu alte trăsături pot oferi informaţii care uşurează identificarea În figura 2 9 un lac poate fi asociat cu un port, bărci hoteluri şi spaţii verzi Figura 2 8: Imaginea satelitară a unei păduri Figura 2 9: Imagine satelitara a unui port 21 Clasificarea şi analiza imaginilor Analistul uman, în încercarea de a clasifica trăsăturile într-o imagine, utilizează elemente vizuale de interpretare pentru a identifica grupuri omogene de pixeli Aceste grupuri reprezintă diverse caracteristici sau zone de interes Clasificare digitală a imaginii utilizează informaţile spectrale reprezentate de numere digitale din una sau mai multe benzi spectrale, şi încearcă să clasifice fiecare pixel în parte în funcţie de informaţia spectrală Acest tip de clasificare se numeşte recunoaşterea modelelor spectrale În ambele cazuri, scopul este de a atribui toţi pixelii din imagine unei clase sau teme Imaginea rezultată în urma clasificării are forma unui moza ic cu pixeli, unde fiecare aparţine unei anumite teme Când vorbim despre clase, trebuie să deosebim c lasele de infor maţie de clasele spectrale Clasele de informaţie sunt acele categorii pe care analistul încearcă să le identifice în imagini, cum ar fi diferite tipuri de culturi, de specii de arbori, diferite tipuri de roci şi multe altele Clasele spectrale sunt grupuri de pixeli ce au valorile luminozităţii uniforme în diferite canale spectrale Obiectivul este de a face o legătură între clasele spectrale şi cele de informaţie Rareori se poate face o legătură unu la unu între cele două tipuri de clase, deoarece, în general, pot apărea clase spectrale care nu corespund niciunei clase de informaţie intersante analistului Procedurile comune de clasificare pot fi împărţite, bazându -ne pe metodele utilizate, în două categorii: clasificarea supervizată şi clasificarea nesupervizată Clasificarea supervizată este atunci când se cunosc clasele de obiecte de pe suprafaţa Pământului existente pe anumite zone ale imaginii Aceste zone se încadrează în tipare după care se elaborează reguli care urmează să fie extinse la porţiunile neclasificate din imagine Adică, utilizatorul identifică câteva zone din imagine care sunt caracteristice fiecărei clase stabilite, iar apoi, cu ajutorul analizei de imagine, sunt clasificaţi şi ceilalţi pixeli În concluzie, clasificarea supervizată se bazează pe cunoştiinţa apriori a caracteristicilor suprafeţei unei porţiuni din imagine şi utilizarea acestora în clasificarea celorlalte porţiuni Clasificarea nesupervizată presupune crearea grupelor de pixeli ce reprezintă caracteristici geografice, fără a cunoaşte apriori ceea ce se clasifică Practic, pixelii sunt constituiţi în clase de clusteri, după care se verifică dacă aceştia au semnificaţie sau nu în imaginea digitală creată Figura 2 10: Clasificare supervizată Figura 2 11: Clasificarea nesupervizată 22 Cap 3: EXTRAGEREA TRĂSĂTURILOR SPECTRALE ŞI DE TEXTURĂ Parametrii principali care stau la baza analizei de imagini satelitare sunt parametrii spectrali şi cei de textură Culoarea şi textura imaginii poartă informaţia primară despre conţinutul scenei analizate, şi anume despre obiectele şi structura suprafeţei 3 1 Extragerea trăsăturilor spectrale După cum s-a menționat şi în capitolul 2, imaginile sunt funcţii cu două variabile a căror semnificaţie este de coordonate spaţiale Imaginile sunt digitale atunci când atât funcţia cât şi variabilele iau numai valori finite O imagine digitală este văzută ca o matrice în care sunt înscrise valorile funcţiei imaginii iar cele două variabile corespund liniilor şi coloanelor matricei Fiecare element al acestei matrici se numeşte pixel Astfel că o imagine este formată din pixeli ce au o anumită poziţie şi o anumită valoare Trăsăturile spectrale ale unei imagini sunt extrase cu ajutorul histogramei acesteia Histograma unei imagini digitale cu nivele de gri în intervalul este o funcţie discretă h(rk)=nk, unde rk este nivelul de gri k şi nk este numărul de pixeli din imagine ce au acest nivel de gri Histograma poate fi văzută şi ca o densitate de probabilitate de ordinul unu Acest lucru va fi demonstrat în cele ce urmează Foarte multe tehnici de prelucrare şi analiză a imaginilor sunt bazate pe o abordare statistică Această abordare presupune imaginea o realizare particulară a unui semnal aleator bidimensional caracterizat de mărimi statistice Mărimea statistică cel mai des folosită este densitatea de probabilitate de ordinul unu a câmpului aleator (semnal aleator cu suport bidimensional) Datorită discretizării valorilor pixelilor din imagine, densitatea de probabilitate căutată este nulă peste tot , mai puţin în punctele ce corespund volorilor pixelilor, {0, 1, , N-1}, unde N este numărul maxim de valori posibile ale pixelilor În aceste puncte, funcţia de densitate de probabilitate acumulează probabilităţile de apariţie ale valorilor corespunzătoare Probabilităţile trebuie estimate conform relaţiei : unde P(i)=probabilitatea de apariţie a evenimentului i ni = numărul de cazuri favorabile (de câte ori apare evenimentul i) n = numărul de cazuri posibile În ipoteza că valorile pixelilor dintr -o imagine sunt independente statistic, atunci respenctivele probabilităţi pot fi estimate folosind valorile pixelilor din imag ine Funcţia rezultată, ce semnifică densitatea de probabilitate de ordin unu determinată experimental, se numeşte histograma imaginii şi este dată de relaţia: i = 0,1, ,N-1 (3 2) unde ni = numărul de pixeli din imagine ce au nivelul de gri i n = L x C (numărul total de pixeli din imagine) 23 Imaginea din figura 3 1 are histograma prezentată în figura 3 2 Figura 3 1: Imagine multimedia cu flori Figura 3 2: Histograma imaginii din fig 2 1 După cum se poate observa, şi din cele două figuri, histograma imaginii oferă informaţii aspura conţinutului acesteia: gama de variaţie a valorilor, calitatea perceptuală a imaginii şi numărul de tipuri de obiecte din imagine Deoarece este o distribuţie de ordin unu, din histogramă nu putem afla aşezarea spaţială a pixelilor şi nici numărul de obiecte conţinute de imagine 3 2 Extragerea trăsăturilor de textură Textura este o caracteristică importantă pentru descrierea unei regiuni Textura nu are o definiţie ştiinţifică Intuitiv, aceasta este descrisă cu ajutorul termenilor: regularitate, omogenitate, granlaritate La scară dată, textura are un aspect similar în orice parte a sa Figura 3 3: Textură scoarță Figura 3 4: Textură textil Figura 3 5: Textură zid Pentru a descrie textura unei regiuni, în procesarea imaginilor, sunt folosite trei metode: statistică, structurală şi spectrală Metoda statistică caracterizează trăsături ale texturii ca netezimea, asprimea, granularitatea Metodele structurale se ocupă cu aranjamentul spaţial de bază al imaginii, cum ar fi descrierea texturii cu ajutorul regularităţii spaţierii liniilor paralele Metodele spectrale sunt bazate pe propietăţi ale spectrului Fourier şi, în principal, sunt utilizate pentru identificarea energiilor înalte, vârfurilor înguste din spectru 24 3 2 1 Metodele statistice Una dintre cele mai simple metode de a descrie textura este utilizarea momentelor statistice ale imaginii sau regiunii cum ar fi histograma nivelelor de gri Fie i o variabilă aleatoare ce reprezintă nivelul de gri şi h(i) , i=0,1,2, , N-1, corespondentul histogramei, unde N este numărul de nivelurilor de gri diferite Momentul statistic de ordin n al lui i este dat de relaţia: unde m este valoarea medie a lui i (media nivelurilor de gri): Din ecuaţia 3 3 rezultă că µ0=1 şi µ1=0 În descrierea texturii, momentul statistic de ordin doi (varianţa σ2= µ2) are o importanţă aparte Acesta este o mărime a contrastului nivelurilor de gri care poate fi utilizată pentru a descrie netezimea relativă De exemplu mărimea este 0 pentru suprafeţe cu intensitate constantă (varianţa este 0) şi aproape 1 pentru valori mari ale varianţei Deoarece valorile varianţei tind să fie mari pentru o imagine cu nivele de gri în intevalul , normalizarea varianţei în intevalul este o idee bună Ac est lucru se face foarte simplu, împărţind σ2 la (N-1)2 Deviaţia standard (σ) este şi ea o mărime des folosită în descrierea texturii deoarece valorile acesteia tind să fie mai intuitive pentru mulţi oameni Unele mărimi adiţ ionale, pentru descrierea texturii bazată pe histogramă, utilizează o măsură a uniformităţii dată de ecuaţia 3 6 şi o măsură a entropiei definită în ecuaţia 3 7 Deoarece h are valori în intealul şi suma lor este egală cu 1, uniformitatea are valoarea maximă pentru o imagine cu toate nivelurile de gri egale Entropia este o măsură a variabilităţii şi este egală cu 0 pentru o imagine constantă Pentru exemplificare am calculat mărimile precedente pentru cele 3 imagini de textură (figura 3 3, 3 4, 3 5), în tabelul 3 1 sunt trecute rezultatele Calculele au fost implementate în funcția „text spectral m” și sunt prezentate în Anexa 3 25 Tabelul 3 1: Caracteristicile de textură determinate pe baza histogramei imaginii m σ2 R U e Fig 2 2: scoarță 7,2858 5,4078 0,8439 0,1332 3,1388 Fig 2 3: textil 6,1914 6,9895 0,8748 0,1039 3,3776 Fig 2 4: zid 5,069 4,4073 0,8151 0,1404 3,0610 Măsurile de textură bazate doar pe utilizarea histogramei sunt limitate deoarece histograma nu oferă nicio informaţie cu privire la poziţia relativă a pixelilor O modalitate de a introduce în analiza texturii şi poziţ iile pixelilor este de a lua în considerare atât distribuirea intensităţii cât şi poziţiile pixelilor ce au intensităţi apropiate Un mod de a reţine poziţiile pixelilor cu intensităţi egale este folosirea matricii de coocurenţă Fie o textură definită pe suportul spaţial R Matricea de coocurenţă a unei regiuni grupează probabilitatea de apariţie în regiunea R a diferitelor perechi de valori posibile ale pixelilor ce satisfac o regulă de plasament spaţial În concluzie matricea de coocurenţă este compusă din medii spaţiale de ordinul doi (probabilitatea de apariţie în textură a unor perechi de nivele de gri) Regula de plasament spaţial este existenţa unei separări spaţiale t = (∆i, ∆j) între pixelii ce formează perechea t=(0,1) t=(0,-1) t=(1,1) M este o matrice pătrată, de dimensiune egală cu numărul de nivele de gri diferite posibile în imagine Urmează o exemplificare a calculului matricei de coocurență cu t=(0,1) pentru o imagine repezentată prin matricea din figura 3 6 1 2 4 1 1 2 1 1 2 2 4 3 5 3 4 3 4 3 2 4 3 4 5 1 3 2 5 1 Figura 3 6: Matricea unei imagini 26 1 1 1 1 1 3 0 0 2 0 2 1 2 0 2 0 3 1 1 3 1 0 4 1 0 2 1 1 5 0 2 0 0 1 1 1 1 1 2 3 1 1 2 2 2 2 1 1 1 M=(1/24)* 4 5 2 2 1 1 Figura3 7: Exemplificarea calculului matricii de coocurenţă a imaginii din figura 3 6 Caracteristicile de textură care se bazează pe matricea de coocurenţă sunt denumite Caracteristicele Haralick Unele dintre caracteristicile de textură care se bazează pe matricea de coocurenţă se referă direct la omogenitate, contrast şi prezenţa, în imagine, a structurilor organizate Altele reprezintă complexitatea şi natura tranziţiei nivelurilor de gri din imagine Pentru a putea calcula aceste caracteristici, matricea de coocurenţă trebuie să fie simetrică De exemplu, trebuie calculată atât matricea corespunzătoare plasamentului spaţial t = (0,1) cât şi ts = (0,-1), apoi cele două se adună Dar matricea Mts este transpusa celei Mt, astfel că matricea noastră va fi egală cu: Caracteristicile Haralick Notațile folosite: i şi j nivelurile de gri ale celor doi pixeli din pereche, N numărul de niveluri de gri posibile din imagine, M matricea de coocurenţă 1 Omogenitatea (Angular Second Moment) Valorile acestei caracteristici sunt cu atât mai mari cu cât numărul de apariţii ale unei perechi de pixeli este mai mare, acest lucru se întâmplă când există o periodicitate în sensul translaţiei 2 Contrastul (Contrast) 27 Această caracteristică are o valoare mare atunci când, în imagine, se găsesc cât mai multe perechi de pixeli cu nivele de gri foarte diferite 3 Corelaţia (Correlation) 4 Varianţa (Variance) 5 Omogenitatea locală (Invers Difference Moment) 6 Media matricei de coocurenţă (perechea medie) (Sum Difference Average) 7 Varianţa perechilor (Sum Variance) 8 Entropia perechilor (Sum Entropy) 9 Entropia (Entropy) 28 10 Varianţa diferenţei dintre nivelurile de gri ale unei perechi ( Difference Variance) 11 Entropia diferenţei dintre nivelurile de gri ale unei perechi (Diffence Entropy) 12 Măsura I a Informaţiei (Information Measurement I) 13 Măsura II a Informaţiei (Information Measurement II) unde: 29 3 2 2 Metodele structurale Ideea de bază a acestor metode este aceea că, o textură simplă, poate fi folosită pentru a forma texturi noi prin intermediul unor reguli care limitează numărul de aranjamete posibile ale texturii simple 3 2 3 Metodele spectrale Spectrul Fourier este ideal pentru descrierea direcţia modelelor periodice din imagine Deşi sunt uşor de deosebit drept concentraţii mari de energie, aceste modele sunt , în general, greu de identificat cu metode spaţiale În această lucrare, pentru descr ierea texturii, se vor considera folositoare trei caracteristici ale spectrului Fourier Vârfurile ascuţite din spectru ce oferă principala direcţie a modelelor de textură Locul de amplasare a vârfurilor, în planul de frecvenţă ce oferă perioada fundamentală spaţială a modelelor Eliminând orice componentă periodică, prin filtrare, vor rămâne doar elementele neperiodice din imagine, care, apoi pot fi descrise cu ajutorul tehnicilor statistice Deoarece spectrul de frecvenţă este simetric faţă de origine, se va lua în considerare doar jumătate din acesta Astfel, fiecărui model periodic îi este asociat un singur vârf din spectru Detecţia şi interpretarea trăsăturilor spectrului pot fi simplificate prin exprimarea spectrului în coordonate polare pentru a obţine o funcţie unde S este fucția spectrului iar r și sunt variabilele din acest spațiu Pentru fiecare direcție , poate fi considerată o funcție unidimensională Similar, pentru fiecare frecvență r, este o funcție unidimensională Analizând pentru o vaoare fixă a lui aflăm comportamentul spectrului de-a lungul unei direcții radiale față de origine, în timp ce analizând pentru un r fixat aflăm comportamentul spectrului în lungul unui cerc centrat în origine O descriere mai globală se poate obține utilizând următoarele funcții: și unde R0 este raza cercului centrat în origine 30 Rezultatul ecuației (2 31) împreună cu cel al ecuației (3 32) oferă o pereche de valori [S(r) S( )] pentru fiecare pereche de coordonate (r, ) Variind aceste coordonate putem genera două funcții unidimensionale, S(r) și S( ), care constituie o descriere spectral-energie a texturii pentru întreaga imagine sau regiune luată în considerare În plus, descriptorii în sine ai acestor funcții pot fi utilizați pentru a caracteriza cantitativ comportarea acestora De obicei, descriptorii sunt utilizați pentru a localiza cea mai mare valoare, media, varianța amplitudinii sau dististanța dintre medie ș i cea mai mare valoare a fu ncției 31 Cap 4: VIZUALIZAREA DATELOR De obicei, în vizualizarea infomației, datele constau într -un număr mare de înregistrări, fiecare conținând un anumit număr de variabile și o anumită dimensiune Fiecare înregistrare corespunde unei obeservații, măsurători, tranzacții și multe altele Numărul variabilelor reprezintă dimensionalitatea setului de date Seturile de date pot fi unidimensionale, bidimensionale, multidimensionale, sau pot conține tipuri mai complexe de date, cum ar fi text/ hipertext sau ierarhii/ grafice În funcție de numărul d e dimensiuni cu valori arbitrare datele pot fi univariabile sau bivariabile 4 1 Tipuri de date vizualizate 4 1 1 Datele unidimensionale De obicei, datele unidimesionale au o singură dimensiune compactă De exemplu, o dată unidimensională este timpul, unde fiecărui moment de timp îi poate fi asociată una sau mai multe valori de date 4 1 2 Datele bidimensionale Acestea au două dimensiuni diferite Un exemplu tipic sunt datele geometrice, unde cele două dimensiuni distincte sunt longitudinea și latitudinea Cea mai utilizată metodă de reprezentare a datelor bidimensionale este spațiul de coordonate x-y, iar pentru datele geografice bidimensionale sunt hărțile Deși par destul de simplu de gestionat , aceste date creează probleme în cazul în care numărul înregistrărilor ce trebuie vizualizate este foarte mare deoarece axele temporale și hărțile se suprapopulează repede 4 1 3 Datele multidimensionale Multe seturi de date au mai mult de trei dimensiuni, astfel că nu pot fi vizualizate în spații bidimensionale sau tridimensionale Tabelele din bazelele de date relaționale ce au sute de coloane sunt un exemplu de astfel de date Una dintre tehnicile ce permit vizualizarea datelor multidimensionale este tehnica coordonatelor paralele 4 1 4 Text și Hipertext Nu toate datele pot fi descrise cu ajutorul termenilor dimensionalității Astfel de date sunt datele de tip text și hipertext Acest tip de date diferă prin faptul că nu poate fi descris prin numere, și, prin urmare, majoritatea tehnicilor de vizualizare nu pot fi aplicate În cele mai multe cazuri, înaintea utilizării tehnicilor de vizualizare, este necesar ca datele să fie transformate în vectori de caracteristici Un exemplu de transformare simplă este numărarea cuvintelor, care e ste adesea combinată cu o analiză a principalelor componente sau scalarea multidimensională 32 4 1 5 Ierarhii și Grafuri Deseori înregistrările de date sunt în relație cu alte bucăți de informații Grafurile sunt folosite des pentru a reprezenta astfel de interdependențe Un graf constă dintr-un set de obiecte care sunt numite noduri, și din conexiunile dintre acestea, numite legături Un exemplu de astfel de date sunt interrelețiile dintre oameni datorate transmiterii e-mail-urilor 4 1 6 Aloritmi și Soft-uri Confruntarea cu proiecte mari de soft-uri este o provocare Scopul vizualizării est e de a oferi suport dezoltatorilor prin a-i ajuta să înteleagă mai ușor algoritmul,de exemplu afișând fluxul de informații dintr-un program, de a spori înțelegerea codului scris prin reprezentarea grafică a liniilor de cod sursă și de a sprijini programatorii în depanarea codului, de exemplu prin vizualizarea erorilor 4 2 Tehnici de vizualizare Datorită tipurilor cât mai variate de date a fost nevoie de dezvolatarea de noi tehnici de vizualizare capabile sa reprezinte tipuri de date cât mai complexe 4 2 1 Tehnici bazate pe pixeli Ideea de bază este de a reprezenta fiecare valoare a dimensiun ii printr-un pixel colorat şi de a grupa pixelii ce aparţin fiecărei dimensiuni în zone adiacente Întrucât, în general, utilizează un pixel pentru o valoare de date, tehnica permite vizualizarea unor cantităţi mari de date pe ecranele actuale Dacă fiecare valoare a detelor este reprezentată printr -un pixel, întrebarea prinpală este cum sunt aranjați pixelii pe ecran Aceste tehnici utilizează aranjări diferite pentru scopuri diferite Dacă un utilizator dorește să vizualizeze un set mare de date, acesta poate utiliza tehnica de vizualizare cu interogări indepentente care sortează datele în conformitate cu unul sau mai multe atribute și folosește modelul screen-filling (umplerii ecranului) pentru a aranja valorile datelor pe ecran În cazul în care nu există o odonare naturală a datelor, iar obiectivul principal este explorarea interactivă a bazei de date, utilizatorul va fi mult mai interesat de raspunsul anumitor interogări În acest caz utilizatorul poate utiliza tehnicile de vizualizare cu interogări dependente, care afișează relevanța elementelor de date care îndeplinesc acea interogare În loc să reprezinte valorile datelor direct cu un pixel de culoare, tehnicile de vizualizare cu interogări dependente, calculează diferența dintre date și valoarea interogării, combină diferențele față de fiecare va loare a datelor într-o singură diferență de ansamblu și vizualizează diferența atributelor sortată în funcție de diferența de ansamblu Aranjarea elementelor de date centrează cele mai relevante elemente de date în mijlocul ferestrei, iar pe cele mai puțin relevante le pune, sub formă de spirală, către exteriorul ferestrei Toate tehnicile de vizualizare bazate pe pixeli împart ecranul în mai multe ferestre Pentru seturi de date cu m atribute, ecranul este împărțit în m ferestre, una pentru fiecare atribut În cazul interogărilor dependente, este creată o fereastră specială, pentru diferența de ansamblu În interiorul ferestrelor, valorile datelor sunt aranjate conform modului de sortare ales, acesta poate fi după date, pentru interogările independente și după interogare, pentru interogările dependente 33 Corelația, dependențele funcționale și alte relații dintre atribute pot fi detectate cu ajutorul regiunilor corespondente din ferestrele multiple Cele mai cunoscute tehnici de vizualizare bazate pe pixeli sunt: tehnica modelului recursiv şi tehnica segmentelor ciclice Tehnica modelului recursiv este bazată pe un aranjament recusiv general înainte-înapoi al pixelilor şi este particularizat pentru a reprezenta seturi de date, ordonate natural în conformitate cu un atribut Utilizatorul poate specifica parametrii pentru fiecare nivel recursiv astfel controlând aranjarea pixelilor cu scopul de a forma substructuri semnificativ semantic Tehnica segmentelor ciclice are la bază ideea reprezentării datelor în cercuri divizate în segmente, fiecare segment corespunde unui atribut În cadrul segmentelor fiecare atribut este vizualizat ca un singur pixel colorat Aranjarea pixelilor porneşte din centrul cercului şi continuă către exterior trasând o linie ortogonală segmentului Raţionamentul acestei abordări este acela că, aproape de centru, toate atributele sunt apropiate unele faţă de altele, sporind compararea vizuală a valorilor lor 4 2 2 Tehnici bazate pe proiecții geometrice Aceste transformări au ca scop găsirea unor transformări "interesante" ale datelor multidimensionale În această categorie sunt incluse tehnici de explorare statistică, cum ar fi analiza componentelor principale, analiza factorilor și scalarea multidimensională, multe dintre acestea catalogate drept „urmărirea proiecției” Un exemplu de astfel de transformare este tehnica coordonatelor paralele Aceasta reprezintă spaţiul k-dimensional într-un spaţiu bidimensional utilizând k axe echidistante care sunt paralele faţă de o axă a spaţiului Axele corespund dimensiunilor şi sunt scalate liniar de la valoare minimă la valoarea maximă a dimensiunii corespunzătoare Fiecare element de date este reprezentat p rintr-o linie poligonală care intersectează fiecare axă în punctul corespunzător valorii respectivei dimensiuni Deși ideea principală a tehnicii de vizualizare cu coordonate paralele este destul de simplă, aceasta este foarte bună, deoarece dezvăluie o gamă largă de caracteristic i de date, cum ar fi distribuțile diferite de date și dependențele funcționale Cu toate acestea, din moment ce liniile poligonale se pot suprapune, numărul maxim de elemente ce poate fi vizualizat, în același timp, este limitat la aproximativ 1 000 Figura 4 1: Vizualizare cu coordonate paralele 34 4 2 3 Tehnici bazate pe pictograme Ideea de bază este de a reprezenta fiecare element de date multidimensionale printr -o pictogramă Această metodă a fost folosită în fețele lui Chernoff În vizualizarea fețelor lui Chernoff, două dimensiuni sunt reprezentate ca o afișare bidimensională Dimensiunile rămase sunt reprezentate ca proprietăți ale unei pictograme față, forma nasului, gura, ochii și forma propriu -zisă a feței Această vizualizare valorifică sensibiliatatea omului la fețe și trăsături faciale Numărul de elemente ce pot fi vizualizate utilizând fețele lui Chernoff este destul de limitat Tehnica bețelor este o tehnică bazată pe pictograme mult mai potrivită exploatării seturilor mari de date Cum indică și numele, pitograma este un fel de băț Din nou, două di mensiuni sunt utilizate pentru afișare iar celelalte sunt reprezentate ca unghiuri sau lungimi pentru figurile bețe Dacă elementele de date sunt reletiv compacte cu privire la dimensinile de afișare, rezultatul vizualizării constă în modele de texturi care variază în funcție de caracteristicile datelor O abordare care permite vizualizarea unui număr arbitrar de dimensiuni este codificarea ca formă Pictogramele utilizate în tehnica de codificare ca formă reprezintă fiecare dimensiune ca o mică suprafață de pixeli și aranjează mica zonă de pixeli a fiecărui element într -un pătrat sau dreptunghi Pixelii corespunzători fiecărei dimensiuni sunt reprezentați cu o scară de griuri sau culori în conformitate cu valoare de date a dimensiunii Pătratele sau drep tunghiurile mici corespunzătoare elementelor de date sunt apoi aranjate succesiv , linie cu linie 4 2 4 Tehnici bazate pe ierarhii și grafuri Tehnicile de afişări suprapuse sunt concepute pentru a prezenta partiţionat datele într -un mod ierarhic În cazul datelor multidimensionale, dimensiunile datelor utilizate pentru partiţionarea datelor şi construirea ierarhiei trebuie selectate în mod corespunzător Un exemplu de tehnică de afişare suprapusă este Suprapunerea Dimensională Ideea de bază este de a încorpora un sistem de coordonate în interiorul altui sistem de coordonate, de exemplu, două atribute formează sistemul de coordonate exterio r, alte atribute sunt încorporate în sistemu l exterior, şi tot aşa Afişajul este generat prin divizarea sistemelor exterioare în celule dreptunghiulare, în cadrul acestora, următorele două atribute sunt utilizate pentru a acoperi cel de -al doilea nivel de sistem de coordonate Acest proces se poate repeta de mai multe ori 35 Cap 5: IMPLEMENTAREA ȘI VIZUALIZAREA CARACTERISTICILOR SPECTRALE ȘI DE TEXTURĂ Pentru evaluarea metodelor de vizualizare, s-au utilizat două baze diferite de imagini Compararea rezultatelor obţinute ajută la o validare a acestora O bază conţine 1000 de imagini multimedia (Anexa 1), aceasta a fost descărcată de la , şi era clasificată în 10 clase, a câte 100 de imagini de dimensiune 256 x 384 pixeli, astfel: oameni, litoral, monumente istorice, autocare, dinozauri, elefanţi, flori, cai, peisaje montane şi alimente A doua bază de imagini (Anexa 2) conţine 1000 de imagete satelitare dintre care au fost clasificate manual un număr de aproximativ 600; astfel: img 0-99 pădure deasă, img 100-199 oraș, img 200-249 industrial, img 250-299 pădurere rară, img 300-359 nori, img 360-393 apă și uscat, img 394-411 teren de sport, img 412-438 deltă, img 439-490 drum/șosea, img 491-550 pământ și img 551-650 apă Imagetele folosite sunt rezultatul divizării unei imagini de teledetecţie (6600 x 7800 pixeli) descărcate de la Imaginea a fost achiziţionată în zona orașului Hobart, Tasmania, Australia, cu senzorul GeoEye-1, geostereo Aceasta este o imagine multispectrală (4 benzi: albastru, verde, roșu, IR apropiat), pe 11 biți și are 2m rezoluție spațială Acoperă o suprafață de aproximativ 206 km2 Pentru a putea fi vizualizate mai bine, şi pentru a uşura calculele, imagetele utilizate au fost recuantizate pe 8 biți, și au o dimensiune de 200 x 200 pixeli Pentru fiecare imagine au fost calculate atât caracteristicile spectrale cât și cele de textură Aceste caracteristici au fost stocate într -un vector astfel: liniile reprezintă imaginile iar coloanele caracteristicile (c1-c13 caracteristicile Haralick, c14-c29 histograma pt R, c30-c45 histograma pt G, c46-c61 histograma pt B) Vectorul de caracteristici rezultat a fost reprezentat cu tehnica coordonatelor paralele şi prin reprezentarea la nivel de pixel Programul care face aceste operații se numește „Caracteristici m” și este prezentat în Anexa 3 C 4b H Vector de Caracteristici * tif 8b rgb2gray * tif 8b H P T 4b C M Figura 5 1: Schema bloc a lucrării 36 În schema bloc, toate blocurile roz reprezintă funcţii din Matlab, astfel: C -cuantizare m, H- histograma m, M- coocurenta m, P T- ParamText m Baza de imagini a fost încărcată în spațiul de lucru al Matlab-ului, prin comanda: imgdirectory='D:\gripy\facultate\licenta\imagete'; imgfiles=dir([imgdirectory '/* tif']); Caracteristicile spectrale utilizate sunt histogramele imaginii pentru cele trei benzi (RGB) 1 fiecare bandă a imaginii a fost recuantizată pe 16 nivele de gri, cu funcția „cuantizare m” din Anexa 4 2 fiecărei benzi, i-a fost calculată histograma, cu funcția „histograma m” din Anexa 4 Caractersticile de textură sunt cele Haralick prezentate în subcapitolul 3 2 1 1 imaginea a fost transformată din spațiul de culoare RGB în gray cu ajutorul funcției din Matlab „rgb2gray m”; 2 imaginea rezultată la pasul precedent a fost recunatizată pe 16 nivele de gri; 3 s-a calculat histograma; 4 s-a calculat matricea de coocurență simetrică pt plasamentul spațial t=(0,1), cu funcția „coocurenta m” din Anexa 4; 5 iar apoi, cei treisprezece parametri de textură, au fost calculaţi cu funcția „ParamText m” din Anexa 5 Valorile caracteristicilor obținute pentru fiecare imagine au fost stocate într-un vector Liniile acestui vector reprezintă indexul imaginii iar coloanele reprezintă caracteristicile (1-13 caracteristicile Haralick de textură, 14-29 histograma pentru banda de roșu, 30-45 histograma pt banda de verde, 46-61 histograma pentru banda de albastru) Pentru o mai bună vizualizare, vectorul de caracteristi a fost scalat în intervelul deoarece valorile acestuia variau foarte mult şi nu puteau fi reprezentate la scară Vizualizare a fost realizată cu tehnica coordonatelor paralele și prin reprezentarea la nivel de pixel a vectorului Tehnica de vizualizare cu coordonate paralele a fost explicată în subcapitolul 4 2 2 şi a fost realizată cu funcția „parallelcoords m” din Matlab Reprezentarea la nivel de pixel constă din faptul că fiecărei valori existente în vectorul de caracteristici îi corespunde o culoare, aceasta a fost realizată cu funcția „imagesc m” din Matlab Deoarece baza de imagini folosită este mult prea mare pentru exemplificarea funcționării soluției oferite de mine și rezultatele obținute, voi alege doar câte șase imagini din cel două baze de date 37 Imaginile satelitare: Figura 5 2: Imaginile satelitare folosite pentru exemplificare Vectorul de caracteristici asociat celor șase imagini, scalat în intervalul 0-10: Tabelul 5 1: Primele 13 coloane ale vectorului de caracteristici pt img din fig 5 2 (valorile caracteristicilor de textură) 1:f1 Img 1S Img 2S Img 3S Img 4S Img 5S Img 6S 8 7 0 0 4 10 2:f2 4 0 4 4 8 8 3:f3 10 9 1 1 0 2 4:f4 0 0 7 10 1 0 5:f5 10 10 1 0 8 10 6:f6 0 0 8 10 2 0 7:f7 0 0 7 9 3 1 8:f8 0 1 10 10 4 2 9:f9 0 1 9 10 3 1 10:f10 11:f11 12:f12 13:f13 0 0 8 10 2 2 0 0 9 10 3 2 10 10 1 0 10 8 0 3 10 10 10 8 Tabelul 5 2: C 14-29 ale vectorului de caracteristici pt img din fig 5 2, corespuzătoare histogramei pentru banda R (nR 1= niv gri 1) 14: nR 1 Img 1S Img 2S Img 3S Img 4S Img 5S Img 6S 1 1 0 0 9 10 15: 16: nR nR 2 3 10 9 1 0 0 0 9 10 2 1 0 0 17: nR 4 1 2 4 2 0 0 18: nR 5 0 0 8 7 1 1 19: nR 6 0 0 10 10 3 2 20: nR 7 0 0 9 10 2 3 21: nR 8 0 0 9 10 3 3 38 22: nR 9 0 0 9 10 5 3 23: nR 10 0 0 8 10 4 2 24: nR 11 0 0 7 10 3 1 25: nR 12 0 0 7 10 2 1 26: nR 13 0 0 7 10 1 1 27: nR 14 0 0 4 7 1 0 28: nR 15 0 0 5 7 1 1 29: nR 16 0 0 6 10 4 1 Tabelul 5 3:C 30-45 ale vectorului de caracteristici pt img din fig 5 2, corespuzătoare histogramei pentru banda G (nG 1= niv gri 1) 30: nG 1 Img 1S Img 2S Img 3S Img 4S Img 5S Img 6S 2 1 0 0 4 10 31: 32: nG nG 2 3 10 8 0 0 9 5 8 10 1 0 0 0 33: nG 4 0 1 4 2 0 0 34: nG 5 0 0 10 8 2 2 35: nG 6 0 0 10 9 3 2 36: nG 7 0 0 10 10 4 3 37: nG 8 0 0 8 10 4 2 38: nG 9 0 0 7 9 2 1 39: nG 10 0 0 7 10 1 1 40: nG 11 0 0 6 10 1 1 41: nG 12 0 0 6 10 1 1 42: nG 13 0 0 6 8 1 1 43: nG 14 0 0 4 7 1 1 44: nG 15 0 0 2 3 0 0 45: nG 16 0 0 5 8 4 1 Tabelul 5 4: C 46-61 ale vectorului de caracteristici pt img din fig 5 2, corespuzătoare histogramei pentru banda B (nB 1= niv gri 1) 46: nB 1 Img 1S Img 2S Img 3S Img 4S Img 5S Img 6S 9 10 0 0 0 1 47: 48: nB nB 2 3 10 9 0 0 9 10 6 10 10 4 1 2 49: nB 4 0 0 6 4 1 1 50: nB 5 0 0 9 7 2 2 51: nB 6 0 0 9 10 4 3 52: nB 7 0 0 7 10 4 2 53: nB 8 0 0 6 8 2 2 54: nB 9 0 0 5 8 1 1 55: nB 10 0 0 7 10 1 1 56: nB 11 0 0 6 10 1 1 57: nB 12 0 0 7 10 1 1 58: nB 13 0 0 5 9 1 1 59: nB 14 0 0 3 5 1 1 60: nB 15 0 0 2 3 0 0 61: nB 16 0 0 4 8 3 0 Vectorul de trăsături vizualizat cu coordonate paralele: Figura 5 3: C 1-13 ale vectorului de trăsături pt img din fig 5 2(trăsăturile de textură) Figura 5 4: C 14-29 ale vectorului de trăsături pt img din fig 5 2 (histograma pentru banda R) 39 Figura 5 5: C 30-45 ale vectorului de trăsături pt img din fig 5 2 (histograma pt G) Figura 5 6: C 46-61 ale vectorului de trăsături pt img din fig 5 2 (histograma p B) Vectorul de trăsături reprezentat la nivel de pixel: Figura 5 7: Vectorul de trăsături pt img din fig 5 2 reprezentat la nivel de pixel 40 Imagini multimedia: Figura 5 8: Imaginile multimedia folosite pentru exemplificare Vectorul de trăsături asociat imaginilor din figura 5 8: Tabelul 5 5: Primele 13 coloane ale vectorului de caracteristici pt img din fig 5 8 (valorile caracteristicilor de textură) 1:f1 Img 1M Img 2M Img 3M Img 4M Img 5M Img 6M 0 0 0 0 7 10 2:f2 4 8 4 4 0 0 3:f3 2 2 0 0 8 10 4:f4 1 1 0 0 10 10 5:f5 7 5 4 0 10 9 6:f6 1 2 0 1 10 10 7:f7 0 0 0 1 10 10 8:f8 10 10 9 10 0 0 9:f9 8 8 9 10 0 0 10:f10 11:f11 12:f12 13:f13 0 0 7 10 3 3 2 3 7 10 0 1 10 8 5 0 5 1 10 10 10 10 0 5 Tabelul 5 6: C 14-29 ale vectorului de caracteristici pt img din fig 5 8, corespuzătoare histogramei pentru banda R (nR 1= niv gri 1) 14: 15: 16: nR nR nR 1 2 3 Img 1M Img 2M Img 3M Img 4M Img 5M Img 6M 1 0 4 10 0 0 1 1 10 2 0 0 4 5 10 5 0 1 17: nR 4 9 4 10 4 0 1 18: nR 5 10 5 7 2 0 1 19: nR 6 10 7 3 2 0 0 20: nR 7 10 8 1 1 0 0 21: nR 8 8 10 1 1 0 0 41 22: nR 9 5 10 0 2 0 0 23: nR 10 6 10 0 5 0 0 24: nR 11 3 4 1 10 0 0 25: nR 12 3 3 1 10 0 0 26: nR 13 5 5 7 9 0 10 27: nR 14 0 0 2 1 10 1 28: nR 15 0 0 0 0 5 10 29: nR 16 0 1 7 10 0 3 Tabelul 5 7:C 30-45 ale vectorului de caracteristici pt img din fig 5 8, corespuzătoare histogramei pentru banda G (nG 1= niv gri 1) 30: 31: 32: nG nG nG 1 2 3 Img 1M Img 2M Img 3M Img 4M Img 5M Img 6M 1 1 9 10 0 0 4 7 8 10 0 0 6 10 7 8 0 1 33: nG 4 10 6 4 3 0 1 34: nG 5 10 6 1 2 0 0 35: nG 6 10 10 0 2 0 0 36: nG 7 7 10 2 1 0 0 37: nG 8 5 8 10 2 0 0 38: nG 9 7 10 6 9 0 0 39: nG 10 9 10 1 9 0 1 40: nG 11 10 7 2 3 0 2 41: nG 12 4 3 10 1 0 1 42: nG 13 6 3 10 7 0 6 43: nG 14 0 0 0 2 10 2 44: nG 15 0 0 0 0 6 10 45: nG 16 1 0 3 5 1 10 Tabelul 5 8: C 46-61 ale vectorului de caracteristici pt img din fig 5 8, corespuzătoare histogramei pentru banda B (nB 1= niv gri 1) 46: 47: 48: nB nB nB 1 2 3 Img 1M Img 2M Img 3M Img 4M Img 5M Img 6M 0 0 7 10 0 1 3 7 6 10 0 1 8 10 10 7 0 1 49: nB 4 10 7 3 2 0 0 50: nB 5 10 8 3 1 0 0 51: nB 6 7 10 1 1 0 0 52: nB 7 8 10 1 2 0 0 53: nB 8 9 10 3 6 0 0 54: nB 9 8 8 9 10 0 1 55: nB 10 9 7 10 5 0 2 56: nB 11 4 3 6 3 0 10 57: nB 12 1 0 6 4 10 3 58: nB 13 1 0 10 2 7 1 59: nB 14 1 0 0 2 10 2 60: nB 15 0 0 0 0 6 10 61: nB 16 1 0 10 1 1 6 Vectorul de trăsături asociat imaginilor din figura 5 8 vizualizat cu coordonate paralele: Figura 5 9: C 1-13 ale vectorului de trăsături pt img din fig 5 8 (trăsăturile de textură) Figura 5 10: C 14-29 ale vectorului de trăsături pt img din fig 5 8 (histograma p R) 42 Figura 5 11: C 30-45 ale vectorului de trăsături pt img din fig 5 8 (histograma p G) Figura 5 12: C 30-45 ale vectorului de trăsături pt img din fig 5 8 (histograma p B) Vectorul de trăsături asociat imaginilor din figura 5 8,reprezentat la nivel de pixel : Figura 5 13: Vectorul de caracteristici pt img din fig 5 8 reprezentat la nivel de pixel Din reprezentarea la nivel de pixel se poate observa cu uşurinţă care sunt imaginile cu caracteristici asemănătoare deoarece sunt reprezentate prin aceeaşi culoare sau prin culori aprop iate De exemplu, în figura 5 13, trăsătura a zecea are aceeasi culoare pentru primele două imagini, pentru imaginile 3 şi 4 are culori apropiate dar foarte diferite de culoare primelor două Pentru primele patru imagini, caracteristicile 14-61 (histogramele pentru cele trei benzi) sunt reprezentate prin culori diferite ceea ce semnifică existenţa multor culori în imagine 43 În timp ce ultimele două imagini au multe dintre aceste caracteristici reprezenatate cu albastru, conform barei din lateral înseamnă valoarea 0, astfel imaginile au puţine culori Dacă ne uităm la imaginile din figura 5 8 observăm că interpretarea figurii 5 13 a fost făcută corect 44 Cap 6: INTERFAȚA GRAFICĂ Pentru a urmări mai ușor rezultatele am dezvoltat următoarea intefață grafică Codul interfaței este prezentat în Anexa 6 Aplicaţia dezvoltată în această lucrare capătă astfel un caracter practic Figura 6 1: Interfața grafică Poate fi utilizată ca atare pentru orice colecţie de imagini În urma apăsării butonului de START se va începe calcularea vectorului de caracteristici În momentul terminării calculelor, în caseta verde deschis, va apărea mesajul „Execuția s -a terminat!” În cazul în care butonul START nu s-a apăsat, se va utiliza un vector ce a fost calculat anterior Prin selectarea unuia dintre butoanele radio Tex + spect, Textură, Hist pt R, Hist pt G, Hist pt B se va alege ce parte a vectorului de caracteristici va fi vizualizată În sistemul de axe G1, se va vizualiza, vectorul de caracteristici, cu tehnica coordonatelor paralele iar în G2 cu pixeli colorați 45 Figura 6 2: Interfața în urma apăsării butonului de START și de Textură Se poate observa ce imagini au anumită valoare, pentru o anumită caracteristică, prin apăsarea butonului G iar apoi dând click cu mouse -ul pe punctul respectiv din spațiul de axe G1 În urma acestor operații, în listbox, vor apărea imaginile care îndeplinesc condiția respectivă Se poate vizualiza o imagine din listbox prin selectarea acesteia Figura 6 3: Interfața după ce butonul G a fost apăsat și o imagine, din listbox, a fost vizualizată 46 CONCLUZII ȘI DIRECȚII VIITOARE În urma rezultatelor obținute, pot spune că, întra-adevăr, explorarea vizuală a imaginilor este utilă în cazul bazelor mari de imagini Se observă că trăsăturile utilizate diferențiază bine imaginile și conținutul acestora, dar că funcționează mai bine în cazul imaginilor satelitare deoarece acestea, spre deosebire de cele multimedia, sunt mai uniforme și conțin mai puține tipuri de obiecte De exemplu, imaginile satelitare conțin, ori clădiri, mai mici sau mai mari, ori păduri, ori apă sau pământ, sau o combinație a acestora în timp ce imaginile mutimedia conțin o multitudine de tipuri de obiecte, oameni, plante (atît flori cât și copaci), peisaje, alimente și multe altele Soluţia poate fi utilizată pentru diferite tipuri de imagini Această lucrare poate fi dezvoltată prin: - clasificarea automată a imaginilor din baze mari de imagini, prin intermediul vectorului de caracteristici; - utilizarea unei alte metode de vizualizare - calcularea matricii de coocurenţă pentru un alt plasament sapţial 47 BIBLIOGRAFIE Fundamentals of Remote Sensing Rafael C Gonzalez, Digital Image Processing, Second Edition, Editura Prentice Hall, 2001 Constantin Vertan, Prelucrarea și Analiza Imaginilor, 1999 Carmen Pătrașcu, Curs Interfețe Om Mașină (IOM) Mihai Ciuc, Constantin Vertan, Prelucrarea Statistică A Semnalelor, Editura MatrixRom, 2005 Constantin Vertan, Curs Analiza Imaginilor (AI) Haralick's Texture Features Computed by GPUs for Biological Applications http://www iaeng org/IJCS/issues v36/issue 1/IJCS 36 1 09 pdf Daniel A Keim, Information Visualization and Visual Data Mining, în IEEE TRANSACTION ON KNOWLEDGE AND DATA ENGINEERING, vol 8, nr 1, IanuarieMartie 2002 Daniel A Keim, „Visualisation Techniques for Mining Large Databases: A Comparison”, în IEEE TRANSACTION ON KNOWLEDGE AND DATA ENGINEERING, vol 8, nr 6, Decembrie 1996 http://wang ist psu edu/docs/related www digitalglobe com 48 Anexa 1 O parte din baza de imagini multimedia: 49 Anexa 2 50 